胶囊网络(参见例如Hinton等,2018)旨在编码有关对象及其部分之间关系的知识和理由。在本文中,我们为此类数据指定了一个生成模型,并得出了一种用于推断场景中每个模型对象转换的变异算法以及观察到的部分对对象的分配。我们基于变异期望最大化来得出对象模型的学习算法(Jordan等,1999)。我们还根据Fischler和Bolles(1981)的RANSAC方法研究了一种替代推理算法。我们将这些推理方法应用于(i)从正方形和三角形(“星座”)等多个几何对象生成的数据,以及(ii)基于零件的面部模型的数据。 Kosiorek等人的最新工作。 (2019年)通过堆叠的胶囊自动编码器(SCAE)使用摊销推理来解决此问题 - 我们的结果表明,我们在可以进行比较的地方(在星座数据上)大大优于它们。
translated by 谷歌翻译
Barlow(1985)假设,如果$ p(a,b)\ gg p(a)p(a)p(b)$,两个事件$ a $和$ b $的共发生为“可疑”。我们首先以$ 2 \ times 2 $的应急表(包括Yule的$ Y $(Yule,1912)为例,首先审查了经典的关联度量,这仅取决于优势比$ \ lambda $,并且与表的边际概率无关。然后,我们讨论相互信息(MI)和点相互信息(PMI),这些信息取决于$ p(a,b)/p(a)p(b)$作为关联度量的比率。我们表明,一旦删除了边缘的效果,MI和PMI的行为与$ y $相似,作为$ \ lambda $的功能。在某些研究社区中广泛使用了点相互信息,用于标记可疑的巧合,但重要的是要牢记PMI对边际的敏感性,而对稀疏事件的得分提高了。
translated by 谷歌翻译
给定两个对象图像,我们如何在基本对象属性方面解释它们的差异?为了解决这个问题,我们提出了Align-efform-subtrats(ADS) - 解释对象差异的介入框架。通过利用图像空间中的语义对齐作为对基本对象属性的反事实干预,广告可以迭代量化并消除对象属性的差异。结果是一组“分解”的错误度量,这些误差度量可以解释基础属性方面的对象差异。实际和合成数据的实验说明了框架的功效。
translated by 谷歌翻译
我们的目标是在杂乱的家庭笼环境中跟踪和识别小鼠,作为对生物学研究的自动行为识别的前兆。这是一个非常具有挑战性的问题,因为(i)缺乏对每只鼠标的视觉特征,(ii)具有恒定遮挡的场景的紧密范围,使标准的视觉跟踪方法无法使用。然而,每个鼠标位置的粗略估计可从唯一的RFID植入物中获得,因此有可能最佳地将来自(弱)跟踪的信息与关于身份的粗略信息相结合。为了实现我们的目标,我们提出以下关键贡献:(a)将识别问题的制定作为分配问题(使用整数线性编程解决),(b)轨迹和RFID数据之间的亲和力的新概率模型。后者是模型的关键部分,因为它提供了对特定粗糙定位的物体检测的原则性概率处理。我们的方法在该识别问题上实现了77%的准确性,并且能够在隐藏动物时拒绝杂散的检测。
translated by 谷歌翻译
我们考虑在数据列中识别测量单位的问题,该数据列中包含每行中的数值和单位符号,例如“5.2 L”,“7品脱”。在这种情况下,我们寻求识别列(例如体积)的尺寸,并将单位符号与从知识图中获得的有效单位(例如升,品脱)相关联。下面我们呈现PUC,可以准确地识别测量单位,提取定量数据列的语义描述,并规范其条目的语义描述。我们介绍了为测量单位注释的第一个凌乱现实世界的表格数据集,可以启用并加速该领域的研究。我们对这些数据集的实验表明,PUC比现有解决方案实现了更好的结果。
translated by 谷歌翻译
类型推断是识别数据列中的值类型的任务,并在文献中广泛研究。大多数现有类型推断方法支持数据类型,例如布尔,日期,浮点,整数和字符串。但是,这些方法不考虑非布尔分类变量,其中有多个由整数或字符串编码的可能值。因此,这种列作为整数或字符串而不是分类,并且需要由用户手动转换为分类。在本文中,我们提出了一种概率型推断方法,可以识别一般分类数据类型(包括非布尔变量)。此外,我们通过调整现有类型推断方法PType来确定每个分类变量的可能值。结合这些方法,我们呈现PTYPE-CAT,其比现有适用的解决方案更好地实现了更好的结果。
translated by 谷歌翻译
深度生成模型的最新进展导致各种应用领域的令人印象深刻。由于深入学习模型可能会记住部分输入数据的可能性,已经增加了努力,了解出现的记忆。在这项工作中,我们将最近提出的监督学习记忆衡量标准(Feldman,2019)扩展到无监督的密度估算问题,并使它更加计算效率。接下来,我们提出了一项关于概率在诸如变形AutoEncoders等概率深度生成模型中可能发生的记忆的研究。这表明,这些模型易感的记忆形式与模式崩溃和过度装备根本不同。此外,我们表明,所提出的记忆分数测量普通使用的最近邻测试未捕获的现象。最后,我们讨论了几种可用于限制在实践中的记忆的策略。因此,我们的工作提供了理解概率生成模型中有问题的记忆的框架。
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
超越地球轨道的人类空间勘探将涉及大量距离和持续时间的任务。为了有效减轻无数空间健康危害,数据和空间健康系统的范式转移是实现地球独立性的,而不是Earth-Reliance所必需的。有希望在生物学和健康的人工智能和机器学习领域的发展可以解决这些需求。我们提出了一个适当的自主和智能精密空间健康系统,可以监控,汇总和评估生物医学状态;分析和预测个性化不良健康结果;适应并响应新累积的数据;并提供对其船员医务人员的个人深度空间机组人员和迭代决策支持的预防性,可操作和及时的见解。在这里,我们介绍了美国国家航空航天局组织的研讨会的建议摘要,以便在太空生物学和健康中未来的人工智能应用。在未来十年,生物监测技术,生物标志科学,航天器硬件,智能软件和简化的数据管理必须成熟,并编织成精确的空间健康系统,以使人类在深空中茁壮成长。
translated by 谷歌翻译
空间生物学研究旨在了解太空飞行对生物的根本影响,制定支持深度空间探索的基础知识,最终生物工程航天器和栖息地稳定植物,农作物,微生物,动物和人类的生态系统,为持续的多行星寿命稳定。要提高这些目标,该领域利用了来自星空和地下模拟研究的实验,平台,数据和模型生物。由于研究扩展到低地球轨道之外,实验和平台必须是最大自主,光,敏捷和智能化,以加快知识发现。在这里,我们介绍了由美国国家航空航天局的人工智能,机器学习和建模应用程序组织的研讨会的建议摘要,这些应用程序为这些空间生物学挑战提供了关键解决方案。在未来十年中,将人工智能融入太空生物学领域将深化天空效应的生物学理解,促进预测性建模和分析,支持最大自主和可重复的实验,并有效地管理星载数据和元数据,所有目标使生活能够在深空中茁壮成长。
translated by 谷歌翻译